AI资讯新闻榜单内容搜索-DeepSeek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepSeek
DeepSeek强势回归,开源IMO金牌级数学模型

DeepSeek强势回归,开源IMO金牌级数学模型

DeepSeek强势回归,开源IMO金牌级数学模型

就在刚刚,DeepSeek 又悄咪咪在 Hugging Face 上传了一个新模型:DeepSeek-Math-V2。顾名思义,这是一个数学方面的模型。它的上一个版本 ——DeepSeek-Math-7b 还是一年多以前发的。当时,这个模型只用 7B 参数量,就达到了 GPT-4 和 Gemini-Ultra 性能相当的水平。相关论文还首次引入了 GRPO,显著提升了数学推理能力。

来自主题: AI资讯
8780 点击    2025-11-27 22:47
AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型

AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型

AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型

“What is meant often goes far beyond what is said, and that is what makes conversation possible.” ——H. P. Grice

来自主题: AI技术研报
7839 点击    2025-11-21 09:16
速递|日本AI独角兽Sakana AI,以26.5亿美元估值完成1.35亿美元B轮融资

速递|日本AI独角兽Sakana AI,以26.5亿美元估值完成1.35亿美元B轮融资

速递|日本AI独角兽Sakana AI,以26.5亿美元估值完成1.35亿美元B轮融资

当美国巨头如Google、OpenAI 和 Anthropic 竞相开发支撑其 AI 产品的大型语言模型时,Sakana AI、Mistral AI、DeepSeek 和 AI21 Labs 等初创公司正凭借为特定地区、行业或独特功能设计的专业模型开辟自己的细分市场。

来自主题: AI资讯
9196 点击    2025-11-18 16:35
啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1

啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1

啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1

近日,微博正式发布首个自研开源大模型VibeThinker,这个仅拥有15亿参数的“轻量级选手”,在国际顶级数学竞赛基准测试上击败了参数量是其数百倍的、高达6710亿的DeepSeek R1模型。

来自主题: AI资讯
8025 点击    2025-11-18 16:34
2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了

2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了

2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了

微调超大参数模型,现在的“打开方式”已经大变样了: 仅需2-4 张消费级显卡(4090),就能在本地对DeepSeek 671B乃至Kimi K2 1TB这样的超大模型进行微调了。

来自主题: AI技术研报
7722 点击    2025-11-06 10:52
AI 时代,重新定义开发者丨最新白皮书解读

AI 时代,重新定义开发者丨最新白皮书解读

AI 时代,重新定义开发者丨最新白皮书解读

在 AI 时代,开发的边界正被重新划定。 我们能够观察到,越来越多的产品经理、数据分析师、设计师,甚至内容创作者,正在熟练地使用 Cursor、ChatGPT、DeepSeek 等 AI 工具,解决真

来自主题: AI技术研报
9049 点击    2025-10-26 22:27
一个关键词 18 万 ! AI 搜索已经被这帮人玩坏了

一个关键词 18 万 ! AI 搜索已经被这帮人玩坏了

一个关键词 18 万 ! AI 搜索已经被这帮人玩坏了

昨天晚上闲着没事,想在 DeepSeek 搜一下 AI 博主有哪些可以学习的。 结果没想到,搜索结果里竟然出现了我自己。 内心 OS:祖坟冒青烟了,妈妈我出息了,我被 AI 认证了,以后简历可以写被

来自主题: AI资讯
9679 点击    2025-10-22 10:10
DeepSeek 再开源:发布 3B MoE OCR 模型,视觉压缩高达20倍

DeepSeek 再开源:发布 3B MoE OCR 模型,视觉压缩高达20倍

DeepSeek 再开源:发布 3B MoE OCR 模型,视觉压缩高达20倍

刚刚,DeepSeek 推出了全新的视觉文本压缩模型 DeepSeek-OCR。 该模型最大的突破在于极高的压缩效率: 20 个节点每天可处理 3300 万页数据,硬件要求仅为 A100-40G。

来自主题: AI资讯
11845 点击    2025-10-20 16:30
赚钱,DeepSeek果然第一!全球六大顶级AI实盘厮杀,人手1万刀开局

赚钱,DeepSeek果然第一!全球六大顶级AI实盘厮杀,人手1万刀开局

赚钱,DeepSeek果然第一!全球六大顶级AI实盘厮杀,人手1万刀开局

给全球六大LLM各发1万美金,丢进同一真实市场实盘厮杀,会发生什么?这场大战从18日开始,截止目前,DeepSeek V3.1盈利超3500美元,Grok 4实力次之。不堪一提的是,Gemini 2.5 Pro成为赔得最惨的模型。

来自主题: AI资讯
9469 点击    2025-10-20 14:04